차원을 넘어서 한국 학생들의 관사 습득에 대한 총체적 반성이 필수적이다. 이에 따라 앞으로 이어질 본문에서의 Corpus 분석, 교수 방법 및 도구 모색을 통하여 학생들이 자주 범하는 오류를 알아보는 과정을 통해 어떤 오류가 자주 발생하는지, 또 무엇을 중점으로 교육해야하는지 알아보도록 한다.
168;컴퓨터ϙ169;가 아닐까 한다. 새로운 목록의 선정은 교육의 단계를 구분하여 이루어질 필요가 있다. 최근에 미취학 아동에 대한 교육이 증대하므로 미취학 아동을 위한 기본어휘를 비롯하여 각급 학교 단계별로 어휘 목록이 만들어져야 한다. 성인을 위한 어휘 목록도 있는 것이 바람직할 것이다.
1) 영어 색인의 전 처리 과정
1) stopping 기법
Stopping 과정은 문서에 포함된 어휘 중 문서의 개념을 표현하는 데 불필요한 어휘들을 제거해 나가는 과정이다. Stopping 과정에서 제거되는 어휘들은 숫자, 기호, 수식과 같은 문 자열, 문법적으로 사용되는 비 개념어, 지나치게 빈도수가 높거나
Time flies like an arrow; fruit flies like a banana. Oettinger (1966)
컴퓨터가 자연적인 언어(natural language)를 처리하도록 하는 데에 있어서의 어려움에 대한 초기의 연구에서, Anthony Oettinger는 우리가 예상되는 구조(expected structure)에 기반하여 어떻게 문장을 번역하는지, 그리고 우리가 번역하며 오류를 범했을 때,
빈도분포, 문자 종류의 빈도분포 등의 언어 데이터가 가지는 각종의 통계 데이터를 수집 분석할 수가 있다.
둘째는 컴퓨터에 자연어를 이해시켜 주는 자연어 이해 시스템 (natural language understanding system)의 연구다. 자연어 이해 시스템은 컴퓨터와 인간 사이에 존재하는 사용 언어가 서로 다름으로써 생